其他
Github 5w星!100天自学Python,他是怎么做到的?(附Github地址)
来源 :程序人生,Github
先附上github地址:https://github.com/jackfrued/Python-100-Days
给初学者的几个建议:
Make English as your working language. Practice makes perfect. All experience comes from mistakes. Don't be one of the leeches. Either stand out or kicked out.
Day01 - 初识Python
Day02 - 语言元素
Day03 - 分支结构
Day04 - 循环结构
Day05 - 构造程序逻辑
Day06 - 函数和模块的使用
Day07 - 字符串和常用数据结构
Day08 - 面向对象编程基础
Day09 - 面向对象进阶
Day10 - 图形用户界面和游戏开发
Day11 - 文件和异常
读文件 - 读取整个文件 / 逐行读取 / 文件路径 写文件 - 覆盖写入 / 追加写入 / 文本文件 / 二进制文件 异常处理 - 异常机制的重要性 / try-except代码块 / else代码块 / finally代码块 / 内置异常类型 / 异常栈 / raise语句 数据持久化 - CSV文件概述 / csv模块的应用 / JSON数据格式 / json模块的应用
Day12 - 字符串和正则表达式
字符串高级操作 - 转义字符 / 原始字符串 / 多行字符串 / in和 not in运算符 / is开头的方法 / join和split方法 / strip相关方法 / pyperclip模块 / 不变字符串和可变字符串 / StringIO的使用 正则表达式入门 - 正则表达式的作用 / 元字符 / 转义 / 量词 / 分组 / 零宽断言 /贪婪匹配与惰性匹配懒惰 / 使用re模块实现正则表达式操作(匹配、搜索、替换、捕获) 使用正则表达式 - re模块 / compile函数 / group和groups方法 / match方法 / search方法 / findall和finditer方法 / sub和subn方法 / split方法 应用案例 - 使用正则表达式验证输入的字符串
Day13 - 进程和线程
进程和线程的概念 - 什么是进程 / 什么是线程 / 多线程的应用场景 使用进程 - fork函数 / multiprocessing模块 / 进程池 / 进程间通信 使用线程 - thread模块 / threading模块 / Thread类 / Lock类 / Condition类 / 线程池
Day14 - 网络编程入门和网络应用开发
计算机网络基础 - 计算机网络发展史 / “TCP-IP”模型 / IP地址 / 端口 / 协议 / 其他相关概念 网络应用模式 - “客户端-服务器”模式 / “浏览器-服务器”模式 基于HTTP协议访问网络资源 - 网络API概述 / 访问URL / requests模块 / 解析JSON格式数据 Python网络编程 - 套接字的概念 / socket模块 / socket函数 / 创建TCP服务器 / 创建TCP客户端 / 创建UDP服务器 / 创建UDP客户端 / SocketServer模块 电子邮件 - SMTP协议 / POP3协议 / IMAP协议 / smtplib模块 / poplib模块 / imaplib模块 短信服务 - 调用短信服务网关
Day15 - 图像和文档处理
用Pillow处理图片 - 图片读写 / 图片合成 / 几何变换 / 色彩转换 / 滤镜效果 读写Word文档 - 文本内容的处理 / 段落 / 页眉和页脚 / 样式的处理 读写Excel文件 - xlrd模块 / xlwt模块 生成PDF文件 - pypdf2模块 / reportlab模块
常用数据结构 函数的高级用法 - “一等公民” / 高阶函数 / Lambda函数 / 作用域和闭包 / 装饰器 面向对象高级知识 - “三大支柱” / 类与类之间的关系 / 垃圾回收 / 魔术属性和方法 / 混入 / 元类 / 面向对象设计原则 / GoF设计模式 迭代器和生成器 - 相关魔术方法 / 创建生成器的两种方式 / 并发和异步编程 - 多线程 / 多进程 / 异步IO / async和await
用HTML标签承载页面内容 用CSS渲染页面 用JavaScript处理交互式行为 jQuery入门和提高 Vue.js入门 Element的使用 Bootstrap的使用
操作系统发展史和Linux概述 Linux基础命令 Linux中的实用程序 Linux的文件系统 Vim编辑器的应用 环境变量和Shell编程 软件的安装和服务的配置 网络访问和管理 其他相关内容
关系型数据库MySQL 关系型数据库概述 MySQL的安装和使用 SQL的使用 DDL - 数据定义语言 - create / drop / alter DML - 数据操作语言 - insert / delete / update / select DCL - 数据控制语言 - grant / revoke 相关知识 范式理论 - 设计二维表的指导思想 数据完整性 数据一致性 在Python中操作MySQL NoSQL入门 NoSQL概述 Redis概述 Mongo概述
Python学习资料获取方式:转发文章+私信【Python】
Day41 - 快速上手
Web应用工作原理和HTTP协议 Django框架概述 5分钟快速上手 使用视图模板
Day42 - 深入模型
关系型数据库配置 管理后台的使用 使用ORM完成对模型的CRUD操作 Django模型最佳实践 模型定义参考
Day43 - 静态资源和Ajax请求
加载静态资源 用Ajax请求获取数据
Day44 - 表单的应用
表单和表单控件 跨站请求伪造和CSRF令牌 Form和ModelForm 表单验证
Day45 - Cookie和Session
实现用户跟踪 cookie和session的关系 Django框架对session的支持 视图函数中的cookie读写操作
Day46 - 报表和日志
通过HttpResponse修改响应头 使用StreamingHttpResponse处理大文件 使用xlwt生成Excel报表 使用reportlab生成PDF报表 使用ECharts生成前端图表 配置日志和Django-Debug-Toolbar
Day47 - 中间件的应用
什么是中间件 Django框架内置的中间件 自定义中间件及其应用场景
Day48 - 前后端分离开发入门
返回JSON格式的数据 用Vue.js渲染页面
Day49 - RESTful架构和DRF入门 Day50 - RESTful架构和DRF进阶 Day51 - 使用缓存
网站优化第一定律 在Django项目中使用Redis提供缓存服务 在视图函数中读写缓存 使用装饰器实现页面缓存 为数据接口提供缓存服务
Day52 - 文件上传和富文本编辑
文件上传表单控件和图片文件预览 服务器端如何处理上传的文件 富文本编辑器概述 wangEditor的使用
Day53 - 短信和邮件
常用短信网关平台介绍 使用螺丝帽发送短信 Django框架对邮件服务的支持
Day54 - 异步任务和定时任务
网站优化第二定律 配置消息队列服务 在项目中使用celery实现任务异步化 在项目中使用celery实现定时任务
Day55 - 单元测试和项目上线
Python中的单元测试 Django框架对单元测试的支持 使用版本控制系统 配置和使用uWSGI 动静分离和Nginx配置 配置HTTPS
Day56 - Flask入门 Day57 - 模板的使用 Day58 - 表单的处理 Day59 - 数据库操作 Day60 - 项目实战
Day61 - 预备知识
并发编程 I/O模式和事件驱动
Day62 - Tornado入门
Tornado概述 5分钟上手Tornado 路由解析 请求处理器
Day63 - 异步化
aiomysql和aioredis的使用
Day64 - WebSocket的应用
WebSocket简介 WebSocket服务器端编程 WebSocket客户端编程 项目:Web聊天室
Day65 - 项目实战
前后端分离开发和接口文档的撰写 使用Vue.js实现前端渲染 使用ECharts实现报表功能 使用WebSocket实现推送服务
Day66 - 网络爬虫和相关工具
网络爬虫的概念及其应用领域 网络爬虫的合法性探讨 开发网络爬虫的相关工具 一个爬虫程序的构成
Day67 - 数据采集和解析
数据采集的标准和三方库 页面解析的三种方式:正则表达式解析 / XPath解析 / CSS选择器解析
Day68 - 存储数据
如何存储海量数据 实现数据的缓存
Day69 - 并发下载
多线程和多进程 异步I/O和协程 async和await关键字的使用 三方库aiohttp的应用
Day70 - 解析动态内容
JavaScript逆向工程 使用Selenium获取动态内容
Day71 - 表单交互和验证码处理
自动提交表单 Cookie池的应用 验证码处理
Day72 - Scrapy入门
Scrapy爬虫框架概述 安装和使用Scrapy
Day73 - Scrapy高级应用
Spider的用法 中间件的应用:下载中间件 / 蜘蛛中间件 Scrapy对接Selenium抓取动态内容 Scrapy部署到Docker
Day74 - Scrapy分布式实现
分布式爬虫的原理 Scrapy分布式实现 使用Scrapyd实现分布式部署
Day75 - 爬虫项目实战
爬取招聘网站数据 爬取房地产行业数据 爬取二手车交易平台数据
Day76 - 机器学习基础 Day77 - Pandas的应用 Day78 - NumPy和SciPy的应用 Day79 - Matplotlib和数据可视化 Day80 - k最近邻(KNN)分类 Day81 - 决策树 Day82 - 贝叶斯分类 Day83 - 支持向量机(SVM) Day84 - K-均值聚类 Day85 - 回归分析 Day86 - 大数据分析入门 Day87 - 大数据分析进阶 Day88 - Tensorflow入门 Day89 - Tensorflow实战 Day90 - 推荐系统
第91天:团队项目开发准备
软件过程模型
经典过程模型(瀑布模型) 可行性分析(研究做还是不做),输出《可行性分析报告》。 需求分析(研究做什么),输出《需求规格说明书》和产品界面原型图。 概要设计和详细设计,输出概念模型图、物理模型图、类图、时序图等。 编码 / 测试。 上线 / 维护。 敏捷开发(Scrum)- 产品所有者、Scrum Master、研发人员 - Sprint 产品的Backlog(用户故事、产品原型)。 计划会议(评估和预算)。 日常开发(站立会议、番茄工作法、结对编程、测试先行、代码重构……)。 修复bug(问题描述、重现步骤、测试人员、被指派人)。 评审会议(Showcase)。 回顾会议(当前周期做得好和不好的地方)。
个体和互动 高于 流程和工具 工作的软件 高于 详尽的文档 客户合作 高于 合同谈判 响应变化 高于 遵循计划
项目团队组建
团队的构成和角色 说明:谢谢付祥英女士绘制了下面这张精美的公司组织架构图。
编程规范和代码审查(flake8、pylint)
Python中的一些“惯例”(请参考《Python惯例-如何编写Pythonic的代码》) 影响代码可读性的原因: 代码注释太少或者没有注释 代码破坏了语言的最佳实践 反模式编程(意大利面代码、复制-黏贴编程、自负编程、……)
团队开发工具介绍
版本控制:Git、Mercury 缺陷管理:Gitlab、Redmine 敏捷闭环工具:禅道、JIRA 持续集成:Jenkins、Travis-CI
选题范围设定
CMS(用户端):新闻聚合网站、问答/分享社区、影评/书评网站等。 MIS(用户端+管理端):KMS、KPI考核系统、HRS、CRM系统、供应链系统、仓储管理系统等。 App后台(管理端+数据接口):二手交易类、报刊杂志类、小众电商类、新闻资讯类、旅游类、社交类、阅读类等。 其他类型:自身行业背景和工作经验、业务容易理解和把控。
需求理解、模块划分和任务分配
需求理解:头脑风暴和竞品分析。 模块划分:画思维导图(XMind),每个模块是一个枝节点,每个具体的功能是一个叶节点(用动词表述),需要确保每个叶节点无法再生出新节点,确定每个叶子节点的重要性、优先级和工作量。 任务分配:由项目负责人根据上面的指标为每个团队成员分配任务。
制定项目进度表(每日更新)
UML(统一建模语言)的类图
通过模型创建表(正向工程) python manage.py makemigrations app python manage.py migrate
PowerDesigner
第94天:网络API接口设计 第95天:使用Django开发项目
数据库的配置(多数据库、主从复制、数据库路由) 缓存的配置(分区缓存、键设置、超时设置、主从复制、故障恢复(哨兵)) 日志的配置 分析和调试(Django-Debug-ToolBar) 好用的Python模块(日期计算、图像处理、数据加密、三方API)
RESTful架构
理解RESTful架构 RESTful API设计指南 RESTful API最佳实践
API接口文档的撰写
RAP2 YAPI
django-REST-framework的应用
使用缓存缓解数据库压力 - Redis 使用消息队列做解耦合和削峰 - Celery + RabbitMQ
测试的种类 编写单元测试(unittest、pytest、nose2、tox、ddt、……) 测试覆盖率(coverage)
部署前的准备工作
关键设置(SECRET_KEY / DEBUG / ALLOWED_HOSTS / 缓存 / 数据库) HTTPS / CSRF_COOKIE_SECUR / SESSION_COOKIE_SECURE 日志相关配置
Linux常用命令回顾 Linux常用服务的安装和配置 uWSGI/Gunicorn和Nginx的使用
Gunicorn和uWSGI的比较 对于不需要大量定制化的简单应用程序,Gunicorn是一个不错的选择,uWSGI的学习曲线比Gunicorn要陡峭得多,Gunicorn的默认参数就已经能够适应大多数应用程序。 uWSGI支持异构部署。 由于Nginx本身支持uWSGI,在线上一般都将Nginx和uWSGI捆绑在一起部署,而且uWSGI属于功能齐全且高度定制的WSGI中间件。 在性能上,Gunicorn和uWSGI其实表现相当。
虚拟化技术(Docker)
AB的使用 SQLslap的使用 sysbench的使用
使用Shell和Python进行自动化测试 使用Selenium实现自动化测试
Selenium IDE Selenium WebDriver Selenium Remote Control
测试工具Robot Framework介绍
第97天:电商网站技术要点剖析 第98天:项目部署上线和性能调优
MySQL数据库调优 Web服务器性能优化
多线程 异步化
云存储 CDN
第99天:面试中的公共问题 第100天:英语面试
-END-
推荐阅读
【01】【02】【03】【04】【05】